当前位置: 首页>>长者版>>部门动态

北数所推出小语种数据集,助力企业开拓海外市场

日期:2026-05-27 17:18 来源:区数据局 打印页面 关闭页面

近期,北京数据集团、北京国际大数据交易所发布跨境与AI数据集最新成果。依托北京人工智能数据应用开发平台,相关主体联合专业机构打造数据采集、标注加工、质量评测一体化服务体系,建成超6000小时泰语、越语、印尼语等小语种语音高质量数据集,精准解决出海企业语言数据适配难题,为中国企业开拓东南亚等海外市场提供关键数据支撑。

与此同时,北数所持续升级数据跨境与AI数据集综合服务能力,全面支撑大模型训练及各类产业场景落地。此举是北数所落实国家数字经济战略、服务“两区”建设的重要举措。高质量 AI数据集已成为数据流通最活跃领域,小语种数据集填补多语种数据空白,助力跨境电商、智能客服等场景全球化;“数智引擎”则打通数据全流程,激活“数据-模型-场景”飞轮效应,为 AI产业高质量发展与企业出海筑牢数据底座。

下一步,区数据局将深化协同合作,引导辖区企业用好优质数据资源,丰富数字应用场景,助力数字经济与实体经济深度融合。